ارائه روشی مبتنی بر آشفتگی جهت کاوش داده های حساس با حفظ محرمانگی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی
- نویسنده پردیس تقوی
- استاد راهنما محمدرضا کیوان پور
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1393
چکیده
با پیشرفت های اخیر در فرایند ارتباطات و ذخیره سازی داده، میزان زیادی از اطلاعات جمع آوری و ذخیره شده است. چنین میزان گسترده ای از داده ها فرصت های زیادی برای کشف دانش ایجاد می کنند. اگرچه، اطلاعات تقریبا همیشه تحت برخی ملاحظات حفظ حریم خصوصی جمع آوری شده است، اما در سال های اخیر افزایش نگرانی ها درمورد محرمانگی باعث شده است که صاحبان داده ها تمایل به اشتراک گذاری داده هایشان و ایجاد انباره های داده ی اشتراکی نداشته باشند. وجود محدودیت مذکور در جمع آوری داده ها می تواند در میزان موفقیت فرایند داده کاوی اثر منفی داشته باشد، بنابراین انجام داده کاوی با حفظ محرمانگی مسأله پژوهشی مهمی تلقی می شود. یکی از مهم ترین راهکارها جهت حفظ محرمانگی در داده کاوی، روش های مبتنی بر آشفتگی داده است. چالش عمده این دسته از روش ها عدم تعادل مطلوب بین حفظ محرمانگی و دقت داده هاست. براین اساس، تحقیقاتی مبتنی بر روش های تجزیه ماتریس، در راستای رفع چالش فوق و ایجاد تعادل مناسب بین حفظ محرمانگی داده و حفظ سودمندی داده ها صورت گرفته است. اما معمولا در روش های مبتنی بر تجزیه ماتریس، همه داده ها با درجه یکسانی تحریف می شوند، در صورتیکه تمام داده ها اهمیت یکسانی برای داده کاوی ندارند و همه آنها نیازمند یک سطح محرمانگی نیستند. در این پژوهش، در راستای بهبود روش های مبتنی بر آشفتگی، مدلی جدید ارائه شده است. در روش پیشنهادی با استفاده از روش های انتخاب ویژگی تمام ویژگی های مجموعه ی داده بر حسب اهمیتشان برای داده کاوی، به دو گروه تقسیم شده و هر کدام از این گروه ها با مرتبه ی متفاوتی آشفته می شوند. همچنین به منظور جبران کاهش دقت ناشی از تحریف داده ها، از روش های شفاف سازی استفاده شده است. آزمون های مختلف و تحلیل نتایج حاصل از آنها نشان می دهد که روش پیشنهادی ارائه شده، نسبت به روش های پیشین، موجب بهبود سطح حفظ محرمانگی داده ها و دقت نتایج داده کاوی شده است. به بیان دیگر روش پیشنهادی تعادل مطلوبی را بین حفظ محرمانگی و سودمندی داده ها ایجاد می کند.
منابع مشابه
ارائه مدلی جهت حفظ محرمانگی در پردازش داده های کلان
امروزه منابع اطلاعاتی به منابعی مشخص و از پیش تعیین شده محدود نمی شوند و هرگونه اطلاعی همچون ترافیک شبکه، اطلاعات مربوط به پست الکترونیک، رفتار مشتری در هنگام خرید و سایر موارد، می توانند به عنوان یک منبع اطلاعاتی قابل توجه، مد نظر قرار گیرند. بنابراین، برای سازگاری با این عصر جدید در داده ها که به عنوان عصر داده های کلان مطرح می شود، نیازمند زیرساخت ها و تکنیک های جدیدی هستیم که بتوانند با ویژ...
ارائه الگوریتمی برای حفظ محرمانگی داده ها در مقابل فرایند استخراج الگوهای پدیدارشونده حساس میان دو مجموعه داده
جمع آوری و نگهداری حجم بزرگی از داده های مرتبط در کاربردهای گوناگون تجاری و صنعتی، این فرصت را به صاحبان داده می دهد تا بتوانند با استفاده از روش های پیچیده داده کاوی به تحلیل و استخراج دانش موجود در این داده های خام پرداخته و از نتایج حاصل در راستای رشد و ترقی خود و یافتن برتری نسبت به رقبا، استفاده کنند. تمایز کاوی یکی از روش های جدید داده کاوی است که هدف آن کشف کردن تمایزهای میان دو یا چند م...
حفظ محرمانگی داده ها در داده کاوی
داده کاوی فرآیند انتخاب، اکتشاف و مدل کردن مقدار زیاد و متنوعی از داده ها برای کشف قوانین و ارتباط بین آنها به منظور استخراج نتایج مفید برای صاحبان پایگاه داده ها است. دانش حاصل از داده کاوی موضوع جدیدی است که اخیراً در پایگاه داده ها مطرح شده است. این دانش، از اطلاعات شخصی افراد استخراج می شود. در سال های اخیر روش های داده کاوی با معضل مهم محافظت از داده های حساس، از جمله داده های بانکی، پزشکی ...
ارائه روشی جهت پیشبینی اسلامپ بتن مبتنی بر مدل نروفازی تطبیقی
کارایی بتن از اهمیت بسیار بالایی در پروژههای عمرانی برخوردار است. یکی از متداولترین روشها جهت اندازه گیری کارایی بتن، آزمایش اسلامپ است. جهت صرفهجویی در زمان، هزینه و مصالح، بهتر است از روشهای هوشمندی جهت پیشبینی اسلامپ بتن استفاده شود. در این تحقیق یکی از روشهای مبتنی بر محاسبات نرم بکار گرفته میشود تا با طراحی شبکهای، بدون نیاز به انجام آزمایشهای فیزیکی پرزحمت، بتوان تخمینی از اسلام...
متن کاملزمانبندی در محاسبات ابری ترکیبی با حفظ محرمانگی داده ها
به کار گیری فناوری ابرهای محاسباتی از بدو ابداع تا به امروز رو به رشد بوده و این روند با شتاب ادامه دارد. در این میان کلیه سازمانهای تجاری و تحقیقاتی در ابعاد بزرگ، متوسط و یا حتی کوچک خواهان این هستند که خود را با این فناوری که در مرزهای علم قرار گرفته است تطبیق دهند. استفاده از ابر خصوصی برای اجرای برنامه های جریان کاری ، کاهش هزینه و محرمانگی بیشتر اطلاعات سازمان را به دنبال خواهد داشت؛ در ح...
ارائه روشی مبتنی بر الگوریتمهای هوشمند برای حل پخشبار احتمالی جهت برنامهریزی و بهرهبرداری از ریزشبکهها
One of the basic components of future distribution networks are renewable energy resources (RER). The uncertainty in power production of renewable resources such as wind and solar as well as load is another characteristic of such networks. Conventional power flow methods as a basic tool for power system studies may not be suitable for active distribution networks such as microgrids. In this pap...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023